比肩DeepSeek!美团发布首个开源大模型 总参数560B
据CNMO了解,LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数为560B,激活参数18.6B至31.3B,平均为27B,实现了计算效率与性能的双重优化。
模型 开源 美团 deepseek 比肩deepseek 2025-09-01 14:24 3
据CNMO了解,LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数为560B,激活参数18.6B至31.3B,平均为27B,实现了计算效率与性能的双重优化。
模型 开源 美团 deepseek 比肩deepseek 2025-09-01 14:24 3